Thammasorn Sorn

รู้จักกับ Policy Gradient
(reinforce algorithm)

Tag: deep learning reinforcement learning

บทความนี้จะพามารู้จักกับวิธี reinforcement learning อีกแบบหนึ่งนอกจากพวก Q-learning โดยที่ในบทความนี้จะเป็นการ introduce ตัว policy-based reinforcement learning ตั้งแต่ทฤษฏีไปจนถึง coding ง่าย ๆ เพื่อทำงานทดลอง

30 July 2020

Dueling-DQN

Tag: deep learning reinforcement learning

บทความนี้จะพูดถึง extension ของ DQN ที่ชื่อว่า Dueling DQN ซึ่งจะช่วยให้ DQN เรียนรู้ได้เร็วขึ้นด้วยการเรียน value function ของ state และเรียน advantage function แยกกัน เพื่อให้หลาย ๆ action สามารถแชร์ value function กันได้

18 July 2020

กาลครั้งหนึ่งนานมาแล้วมี Double Q-Learning

Tag: reinforcement learning

ในบทความนี้จะเล่าเรื่องปัญหา maximization bias ของ Q-learning ในรูปแบบของนิทานให้ฟัง เพื่อให้เข้าใจง่าย (รึเปล่า ?)

2 July 2020

Deep Q Learning (DQN)

Tag: reinforcement learning deep learning

บทความนี้จะพูดถึง Deep Q-Learning ซึ่งเป็นพัฒนาการสำคัญจาก Q learning โดยการใช้ neural network ในการประมาณค่า Q value แทนที่การเก็บค่า Q ในตาราง

3 June 2020

Q Learning

Tag: reinforcement learning

บทความนี้จะพูดถึง Q-Learning ซึ่งเป็น reinforcement algorithm ที่เป็นพื้นฐานของหลาย ๆ reinforcement algorithm ในปัจจุบัน

3 May 2020

เปิดประตูสู่ Reinforcement Learning ด้วย Multi-Armed Bandit

Tag: reinforcement learning

บทความนี้จะพูดถึงการฝึกคอมพิวเตอร์ให้แก้ปัญหา Multi-Armed Bandit ซึ่งเปรียบเสมือง Hello World ของ reinforcement learning ก็ว่าได้

3 May 2020

Introduction to Reinforcement Learning

Tag: reinforcement learning

บทความนี้เป็นการทำความรู้จักกับ Reinforcement Learning ว่าคืออะไร ต่างจาก Supervised- หรือ Unsupervised-learning ยังไง และเราจะใช้ Reinforcement Learning ในการแก้ปัญหาอย่างไรได้บ้าง

2 May 2020

รู้จักกับ Policy Gradient (reinforce algorithm)

Dueling-DQN

กาลครั้งหนึ่งนานมาแล้วมี Double Q-Learning

Deep Q Learning (DQN)

Q Learning

เปิดประตูสู่ Reinforcement Learning ด้วย Multi-Armed Bandit

Introduction to Reinforcement Learning

รู้จักกับ Policy Gradient
(reinforce algorithm)